بازشناسی زیرکلمات تایپی فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی
- نویسنده محمد علی بیگی
- استاد راهنما سید محمد رضوی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1389
چکیده
شناسایی الگو شاخه ای از هوش مصنوعی است که با طبقه بندی و توصیف مشاهدات سروکار دارد. شناسایی الگو به ما کمک می کند تا داده ها (الگوها) را با تکیه بر دانش قبلی یا اطلاعات آماری استخراج شده از الگوها، طبقه بندی نماییم. بازشناسی نوری حروف یکی از کاربردهای شناسایی الگو می باشد. مسئله بازشناسی حروف الفبای فارسی سابقه ای نه چندان طولانی به همراه دارد. هدف از انجام این تحقیق بازشناسی زیرکلمات تایپی فارسی می باشد. کلمات فارسی از بخشهایی به نام زیرکلمه تشکیل شده است که در صورت بازشناسی آنها، کلمه به صورت کامل بازشناسی می شود. در این پایان نامه، برای بازشناسی زیرکلمات روشی ساده ارائه شده است. در این روش، حروف براساس نقاط و علائم بالا و پایین آن، به 10 گروه تقسیم شده و به دنبال آن زیرکلمات فارسی به گروه های هم علامت تقسیم می شوند. ابتدا نقاط و علائم زیرکلمه و مکان نسبی آنها تشخیص داده می شود و با توجه به آن گروه هم علامتها از مجموعه زیرکلمات فارسی انتخاب می شود. اگر این گروه فقط یک عضو داشته باشد، کلاس آن عضو به زیرکلمه ناشناخته نسبت داده می شود در غیر این صورت بدنه زیرکلمه ناشناخته با بدنه های زیرکلمات هم علامت مقایسه می شود. برای مقایسه، از ویژگیهای مکان مشخصه استفاده می شود. زیرکلمه ای که یکی از بدنه های منتسب به آن با بدنه زیرکلمه ناشناخته کمترین فاصله را داشته باشد، به زیرکلمه ناشناخته نسبت داده می شود. پایگاه داده ای که در اینجا استفاده شده است شامل 1000 زیرکلمه متداول در کلمات فارسی است.
منابع مشابه
مدلسازی بازشناسی واجی کلمات فارسی
Abstract of spoken word recognition is proposed. This model is particularly concerned with extraction of cues from the signal leading to a specification of a word in terms of bundles of distinctive features, which are assumed to be the building blocks of words. In the model proposed, auditory input is chunked into a set of successive time slices. It is assumed that the derivation of the underly...
متن کاملبازشناسی متن تایپی نوشته شده با قلم iranian sans
در این پایان نامه هدف، بازشناسی متن تایپی نوشته شده با قلم iranian sans ، با حداقل اندازه 9 و درجه تفکیک 300 نقطه بر اینچ است. این قلم با توجه به دو خصوصیت زیبایی و خوانایی، بسیار مورد توجه واقع شده و روز به روز بر حجم استفاده از آن در محیط رایانه و اینترنت افزوده می شود. این قلم قابلیت جایگزینی با قلم تاهما که قلم پیش فرض سیستم عامل ویندوز است، را دارد. علیرغم خوانایی، فاصله استاندارد بین سطره...
تصحیح خودکار غلط های تایپی فارسی به کمک شبکه عصبی مصنوعی ترکیبی
Automatic correction of typos in the typed texts is one of the goals of research in artificial intelligence, data mining and natural language processing. Most of the existing methods are based on searching in dictionaries and determining the similarity of the dictionary entries and the given word. This paper presents the design, implementation, and evaluation of a Farsi typo correction system u...
متن کاملشناسایی کلمات فارسی تایپی در تصاویر درجه تفکیک پایین
برای بازشناسی زیرکلمات فارسی سه رویکرد مبتنی بر جداسازی به حروف، مبتنی بر شکل کلی زیرکلمه و ترکیبی از این دو وجود دارد. در بسیاری از سازمان ها، تصاویر نامه ها با درجـه تفکـیک 150 نقطه بر اینچ و کمتر ذخیره می شوند. متنی با این درجه تفکـیک برای خواندن توسط کاربر انسانی مناسب است اما برای بازشناسی توسط سیستم شناسایی نوری کلمات این درجه تفکیک بسیار کم به نظر می رسد. حتی سیستم های شناسایی نوری کلمات...
15 صفحه اولبازشناسی متون چاپی فارسی
برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...
15 صفحه اولبازیابی مستندات تایپی فارسی بر اساس جستجوی کلمه کلیدی
بر خلاف پیشرفت در مخابرات الکترونیکی، بسیاری از اسناد هنوز در شکل کاغذ فرستاده و دریافت می شوند که به دلیل اهمیت حقوقی آن ها باید آرشیو شوند. مدیریت حجم عظیم این اسناد، شرکت های بزرگ را نیازمند به اپراتورها و نیروهای انسانی کرده است تا این اسناد را چک و دسته بندی نمایند یا ممکن است لازم شود مکاتبه ها بر اساس محتوا دسته بندی شوند. هدف ما در این پایان نامه بازیابی مستندات تایپی فارسی بر اساس جستج...
منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه بیرجند - دانشکده مهندسی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023